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Altmetrics 中 的 社交 媒体 事件 分 析 - 


ERA HIR BFI 
北京 师范 大 学 政府 管理 学 院 ”北京 100875 


摘要 : [目的 /意义 ] 为 明确 社交 媒体 中 学 术 成 果 被 关注 、 传 播 和 利用 等 行为 的 内 涵 与 意义 ,对 已 使 用 与 可 
挖 气 的 altmetrics 指标 进行 深度 剖析 。[ 方法 /过程 ] 从 事件 本 体 视 角 出 发 ,对 社交 媒体 中 与 学 术 成 果 相 关 的 行 
为 进行 抽象 ,从 事件 的 主体 、 客 体 、 产 出 、 类 型 动机、 时 间 、 地 点 和 来 源 出 发 ,构建 社交 媒体 事件 模型 ,并 以 Men- 
deley 与 Twitter 为 例 进 行 社交 媒体 事件 的 深层 次 分 析 。[ 结果 /结论 ] 目前 altmetrics 聚合 器 所 提供 的 指标 仅 来 
自 于 社交 媒体 上 的 部 分 事件 ,通过 对 社交 媒体 事件 及 其 各 要 素 的 剖析 ,发现 未 来 应 该 纳入 其 他 同样 具有 学 术 评 
价 价值 的 指标 ,如 文献 被 加 入 的 Mendeley 讨论 组 数量 、 推 文 点 先 数 等 。 指 标 利用 中 需要 根据 事件 的 各 个 要 素 去 
评定 各 指标 在 不 同学 术 评 价 情境 中 的 适用 程度 ,同时 也 要 考虑 数据 采集 的 方法 、 频 率 和 限制 条 件 等 ,以 保证 指 


大 第 的 准确 性 和 科学 性 。 

T= 关键 词 : 学 术 评价 altmetrics 
分 类 号 : G253 
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社交 媒体 事件 
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学 术 评 价 是 指 对 学 术 活 动 及 其 成 果 的 价值 判 
肠 Sj。 通 过 学 术 评价 可 以 衡量 评价 对 象 的 影响 力 , 决 
定性 职 晋 升 、 基 金 项 目 分 配 等 从 而 达到 促进 学 术 发 展 
的 车 标 。 目 前 ,学 术 评 价 的 方法 体系 仍 在 不 断 发 展 完 
善 鸳 中 ,用 于 量化 评价 的 新 指标 也 不 断 涌现 ,altmetrics 
就 是 在 Web2.0 环境 下 涌现 出 的 一 种 评价 方法 ,其 指 
标 守 要 来 源 于 社交 媒体 数据 , 它 为 学 术 成 果 影 响 力 的 
i 量 提供 了 新 的 视角 。 自 2010 年 被 正式 提出 以 来 ,有 
X altmetrics 能 否 及 如 何 应 用 于 学 术 评 价 的 探讨 就 一 
直 持 续 , 有 的 研究 从 数值 角度 出 发 ,分 析 社 交 媒 体 上 的 
文献 覆盖 率 ” 、altmetrics 指标 与 引文 的 相关 性 ” ,对 
altmetrics 的 可 用 性 进行 探讨 ,有 的 研究 从 用 户 角度 出 
发 ,分 析 用 户 对 不 同 领域 成 果 的 偏好 来 探讨 altmetrics 
的 数据 价值 ”。 尽 管 当前 研究 在 不 断 推进 altmetrics 
的 理论 与 实践 发 展 ,但 在 学 术 评 价 中 应 该 如 何 科 学 合 
理 地 应 用 依然 值得 进一步 探索 。 

相 比 于 altmetrics ,引文 的 理论 与 方法 已 经 比较 成 
熟 。 引 文 之 所 以 能 在 当前 的 学 术 评 价 中 占据 一 席 之 


SS 
E 


地 ,根本 原因 在 于 引用 行为 的 本 质 在 于 对 某 个 学 术 成 
果 价 值 的 认可 ,这 一 点 体现 在 施 引 者 的 身份 .动机 以 及 
引用 行为 的 上 下 文 情境 。 为 了 确定 引文 数据 的 利用 价 
值 ,许多 学 者 对 引用 事件 的 动机 进行 了 分 类 和 总 结 。 
王 文 娟 等 中 将 引用 动机 分 为 : “公正 “中 立 ” 以 及 “不 
公正 ”。 公 正 的 动机 包括 提高 文献 的 权威 性 增强 对 读 
者 的 说 服 性 ,中 立 的 动机 包括 自 引 、 对 重要 同行 的 引用 
等 ,而 不 公正 的 动机 包括 因 自 利 、 政 治 因 素 、 内 部 争斗 
等 进行 引用 。 还 有 一 些 研究 将 引文 事件 进行 分 解 , 主 
要 从 引用 位 置 和 引文 文本 进行 深入 分 析 。B. C. Per- 
itz ^ 分 析 了 不 同期 刊 出 现在 介绍 .方法 结果、 讨论 . 结 
论 以 及 附录 5 个 部 分 中 的 引文 与 引用 功能 的 相关 性 ， 
发 现 不 同期 刊 引用 位 置 与 引用 功能 之 间 的 相关 性 不 
同 ,但 相关 性 均 不 高 ,因此 能 否 使 用 引用 位 置 来 代表 引 
文 功能 还 需 进一步 探讨 。 为 了 探讨 引用 行为 的 情感 、 
动机 及 分 布 情况 ,S. Teufel 等 1 利用 自然 语言 识别 技 
术 对 引文 文本 进行 情感 分 类 , 构建 了 自动 识别 引用 功 
能 的 系统 ,将 引用 功能 分 为 4 类 : 指出 不 足 ` 对比、 继 
承 、 中 立 。 

与 引文 类 似 , 对 于 altmetrics 的 研究 也 不 能 仅 停 留 
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在 指标 值 表层 ,而 应 该 还 原 指标 值 从 产生 到 不 断 变 化 
的 情境 ,探讨 其 所 关联 的 主客 体 .操作 和 行为 是 否 有 学 
术 评 价 价值 。 已 有 部 分 研究 对 产生 altmetrics 指标 的 
行为 及 其 动机 进行 了 探索 ,为 了 讨论 这 些 行为 在 网 上 
所 留 下 的 痕迹 ,2014 年 PLOS ALM 研讨 会 商定 了 一 系 
列 通 用 术语 ,包括 科研 对 象 .事件 ,来源 、 消 费 者 等 四 。 
为 了 更 好 地 理解 异 质 的 网 络 行为 ,R，Costas 等 认为 
altmetrics 指标 主要 包括 3 类 要 素 : 事 件 .代理 和 交互 方 
式 ,并 将 引文 分 析 中 的 共 引 与 耦合 推演 至 altmetrics 
中 ,构建 了 社交 媒体 事件 的 引用 框架 。2016 年 ,S. 
Haustein 等 "0 对 与 科研 对 象 相关 的 网 络 行为 进行 了 分 
类 ,包括 访问 .评价 和 应 用 ,还 引入 相关 理论 探讨 不 同 
类 型 事件 的 行为 动机 。 此 外 ,S，Haustein 等 "还 认为 
相同 altmetrics 指标 的 动机 也 可 能 存在 差异 ,例如 Twit- 
ter 吊 推 文 提 及 数 可 能 是 由 作者 自 引 、 对 文献 的 赞成 或 
批判 等 组 成 ,Mendeley 的 读者 数 可 以 代表 对 文献 的 快 
AEREN AH. M. Thelwall 45" 发现 很 少 有 
推 甸 明 确 装 扬 或 批评 一 篇 文章 , 推 文本 身 很 少 对 文献 
进行 深入 评价 。 
ORN altmetrics 在 学 术 评价 中 的 应 用 ,不 仅 要 根据 
慕 借 类 型 衡量 其 所 反映 的 影响 力 ,还 需要 将 事件 进 一 
瞩 咕 解 ,分 析 事件 的 各 组 成 要 素 与 评价 的 匹配 度 。 有 
些 研究 虽 未 明确 提出 或 使 用 事件 的 概念 ,但 本 质 上 是 
XÍzilimetries 所 关联 的 事件 组 成 因素 分 析 , 其 中 有 关上 
户 量 研究 较 多 。 有 的 研究 探讨 不 同 职业 用 户 对 不 同 
台风 青睐 程度 。Z，Zahedi 等 中 指出 F1000 的 主要 用 
户 楚 在 特定 领域 的 专家 教职员 工 ,而 Mendeley 的 主要 
用 四 是 一 些 年 轻 学 者 或 学 生 。 也 有 部 分 研究 探讨 不 同 
职业 的 用 户 对 不 同学 术 成 果 的 青睐 程度 。L，Bom- 
mann ^& ?' 利用 Mendeley 提供 的 用 户 职 业 信息 与 
F1000 提供 的 文献 标签 对 此 进行 了 探讨 ,发 现 Mende- 
ley 上 的 用 户 对 F1000 中 标签 为 “confirmation” 以 及 “in- 
teresting hypothesis” 的 论文 没什么 兴趣 , 而 对 标签 为 
“good for teaching” 的 论文 十 分 感 兴 趣 ; 博 士 后 、 博 士 以 
及 教授 对 标签 为 “new finding” 的 论文 的 感 兴趣 程度 差 
异 很 大 ,可 见 ,含有 该 标签 的 论文 会 对 altmetrics 值 产 
生 更 大 的 影响 。 

尽管 当前 研究 已 经 逐步 开始 从 事件 角度 对 altmet- 
rics 进行 探索 ,引文 事件 的 研究 也 可 以 作为 前 期 基础 ， 
但 与 引用 事件 相 比 ,altmetrics 事件 具有 多 样 性 ,复杂 性 
和 模糊 性 。 相 关 事 件 包 括 阅读 、 收 藏 .下 载 .评论 .转发 
等 。 事件 客体 可 能 包括 论文 .著作 .软件 .专利 演讲 
等 ;事件 主体 不 仅 是 具有 发 表 学 术 成 果 能 力 的 学 者 ,还 


S 


是 人 研究 机 构 、 大 学 、 社 会 大 众 等 ;主客 体 的 多 样 性 
决定 了 事件 动机 的 复杂 性 。 在 当前 的 研究 或 应 用 中 ， 
往往 只 是 直接 利用 聚合 器 提供 的 某 些 指标 值 ,而 数值 
的 产生 过 程 是 一 个 黑 盒 ,因此 对 这 些 数值 的 利用 在 
定 程度 上 可 以 视 为 有 些 “ 盲 目 " 。 此 外 ,所 能 够 利用 的 
altmetrics 指标 范围 也 受 限 于 当前 商业 性 聚合 器 的 功 
能 ,这 些 指标 是 最 具 学 术 评价 价值 的 ,但 还 受到 数据 的 
可 获得 性 .技术 能 力 的 制约 。 

社交 媒体 是 altmetrics 指标 的 主要 来 源 ,因此 笔者 
主要 面向 社交 媒体 事件 构建 分 析 框 架 ,由 于 Mendeley 
和 Twitter 平台 上 的 altmetrics 禾 羡 率 最 高 ' ,被 认为 
是 最 具 潜 力 的 指标 数据 来 源 平台 … ,因此 笔者 以 这 两 
个 平台 为 例 , 梳 理学 术 成 果 相 关 的 各 种 事件 ,对 每 个 事 
件 的 主客 体 .类 型 动机 \ 产 出 等 进行 前 析 ,判断 哪些 事 
件 能 够 作为 学 术 评 价 的 数据 来 源 ,对 这 些 事件 的 捕获 
是 否 会 存在 偏差 等 ,为 altmetrics 在 学 术 评价 中 的 应 用 
提供 支撑 。 


2 社交 媒体 事件 模型 


为 完整 还 原 事件 情境 ,对 与 学 术 成 果 相 关 的 社交 
媒体 事件 进行 分 析 时 ,可 以 复 用 已 有 的 事件 本 体 , 例 如 
伦敦 大 学 提出 的 事件 本 体 ,包括 6 类 要 素 : 事 件 / 子 事 
件 . 代 理 . 因 子 、 产 出 空间、 时 间 '"。 笔 者 结合 altmet- 
rics 的 特征 ,构建 社交 媒体 事件 模型 ,相关 要 素 包 括 主 
体 、 客 体 、 产 出 、 类 型 动机、 时 间 、 地 点 和 来 源 ,如 图 1 
所 示 : 


D- P a. 


产 出 q HRR ———»- 类 型 


BD- `E 


地 点 


1 社交 媒体 事件 模型 


主体 即 代 理 , 是 通过 社交 媒体 进行 交互 的 要 素 , 例 
如 Twitter 用 户 、Mendeley 用 户 等 。 行 为 操作 的 执行 者 
是 事件 动机 的 核心 ,理想 情况 下 如 果 能 够 记录 他 /她 执 
行 某 个 操作 时 对 该 学 术 成 果 的 态度 , 那 在 学 术 评价 中 
就 可 以 将 态度 与 评价 场景 结合 起 来 。 但 现实 中 往往 难 
以 实现 ,因此 我 们 需要 尽 可 能 多 的 获取 主体 的 属性 , 例 
如 身份 学科 ,地域 等 ,以 此 来 判断 其 动机 和 态度 。 

客体 即 学 术 对 象 ,包括 论文 .著作 、 专 利 等 学 术 成 
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果 。 相 比 于 引文 ,社交 媒体 中 所 涉及 的 学 术 成 果 更 加 
多 样 ,特别 是 有 大 量 非 正式 出 版 的 成 果 , 应 充分 考虑 其 
在 学 术 评价 中 的 价值 。 

产 出 即 事件 发 生 之 后 的 结果 或 产物 ,包括 直接 产 
出 和 间接 产 出 。 引 用 行为 的 直接 产 出 是 引文 文本 ,由 
此 可 以 衍生 出 引文 次 数 ,进而 是 h 指数 .期刊 影响 因子 
等 。 同 样 ,社交 媒体 事件 的 产 出 既 包括 某 操作 的 直接 
呈现 结果 ,例如 提 及 某 个 学 术 成 果 的 推 文 , 也 包括 由 社 
交 媒 体 API 或 聚合 器 提取 整合 的 altmetrics 指标 ,如 提 
及 次 数 。 需 要 注意 的 是 ,并 不 是 所 的 社交 媒体 事件 的 
产 出 都 可 以 被 捕获 ,有 时 会 因为 权限 问题 无 法 获取 ,而 
且 由 于 不 同 平台 API 的 更 新 时 间 与 频率 不 同 ,所 能 获 
取 到 的 产 出 可 能 会 存在 一 定 滞后 。 
本 类 型 是 指 代 理 与 学 术 对 象 之 间 的 交互 类 型 。 由 于 
社交 媒体 众多 ,其 定位 和 功能 各 不 相同 , 相 比 于 引用 事 
伞 g 社 交 媒体 事件 类 型 更 加 多 样 。 从 学 术 评 价 角 度 来 
看 , 训 以 根据 主体 对 学 术 对 象 利用 的 动机 和 层次 来 进 
行 一 件 分 类 :GD 访问 ( access ) , 即 对 学 术 对 象 进行 访问 
利用 或 者 体现 出 对 其 感 兴趣 的 行为 ,如 查看 或 下 载 广 
FS OWH (appraise ) , 即 在 社交 媒体 中 通过 排名 、 投 
王 提 及 等 方式 表达 对 学 术 对 象 的 态度 ;@@ 应 用 (ap- 
pl 这 是 对 学 术 对 象 最 深层 次 的 利用 ,在 现 有 学 术 对 


一 


同 ,可 获取 到 的 数据 也 不 同 。 

上 述 分 析 模 型 是 学 术 评 价 视角 下 对 社交 媒体 事件 
的 抽象 ,模型 中 要 素 的 各 个 特征 都 可 能 会 影响 该 事件 
在 学 术 评 价 中 的 价值 和 应 用 方法 ,后 续 人 研究 中 可 根据 
此 模型 对 各 个 社交 媒体 事件 进行 实例 化 ,深入 探讨 和 
评判 这 些 事件 能 否 以 及 如 何在 学 术 评 价 中 加 以 应 用 。 


3 ”社交 媒体 事件 解析 


在 众多 altmetrics 指标 中 ,学 术 社 交 网 络 平 台 Men- 
deley 和 大 众 社交 网 络 平台 Twitter 是 两 个 重要 且 有 代 
表 性 的 来 源 。 很 多 学 者 都 对 这 两 个 平台 产生 的 altmet- 
rics 指标 值 进 行 了 讨论 与 分 析 , 主要 结论 是 它们 与 引 
文 次 数 有 一 定 的 相关 性 。 然 而 , 现 有 研究 主要 是 从 数 
值 层 面 对 Mendeley 和 Twitter HEITA 9r ,.JEZRTR A SUR 
件 本 质 ,因此 笔者 以 这 两 个 平台 为 例 , 应 用 社交 媒体 事 
件 模 型 进行 深层 次 分 析 。 

3.1 Mendeley 

目前 Mendeley 已 有 3 000 万 条 文献 信息 和 超过 
600 万 的 用 户 ,是 学 术 圈 中 比较 流行 的 社交 媒体 。 
Mendeley 应 用 于 学 术 评 价 的 可 行 性 主要 是 来 自 其 用 户 
群体 和 功能 定位 。 用 户 可 以 进行 文献 的 搜索 、 保 存 和 
标记 ,还 可 以 在 讨论 组 中 共享 文献 ,与 同行 建立 联系 


4H mie .方法 和 结论 的 基础 上 创建 新 的 成 果 , 如 对 基 
篇 文章 的 深度 讨论 演讲 中 利用 某 篇 文章 的 内 容 、 扩 展 
币 托 合作 网 络 等 进一步 转化 运用 "" 。 

己 动机 是 主体 执行 某 种 行为 的 心理 倾向 或 内 部 驱 
力 z 邯 主体 为 什么 要 对 某 个 客体 执行 某 种 操作 ,会 不 会 
与 镭 术 评价 目标 存在 关联 。 只 有 充分 了 解 不 同 社交 媒 
体 事件 背后 的 动机 ,才能 够 触及 altmetrics 指标 的 本 
质 , 进 而 探讨 其 在 学 术 评价 中 的 应 用 。 

时 间 是 指 事件 相关 的 各 类 时 间 , 既 包括 事件 发 生 
的 时 间 , 还 包括 事件 中 主客 体 等 所 涉及 的 时 间 。 在 引 
文 分 析 中 会 涉及 到 学 术 成 果 的 发 表 时 间 ( 在线 发 表 和 
正式 发 表 ) ,被 引用 时 间 等 ,时 间 粒 度 多 为 年 月 日 。 而 
在 社交 媒体 事件 中 ,时 间 因素 更 为 复杂 ,社交 媒体 对 学 
术 成 果 的 反应 更 为 快速 ,时 间 粒 度 可 到 小 时 、 分 钟 甚至 


地 点 是 指 包括 事件 及 相关 要 素 所 涉及 的 空间 , 例 
如 事件 主客 体 所 属 的 国家 、 机 构 等 空间 信息 ,事件 来 源 
平台 的 位 置信 息 。 地 理 位 置 的 差别 有 助 于 深入 理解 事 
件 发 生 的 原因 和 背景 。 

来 源 是 指 社 交 媒 体 事件 发 生 的 平台 ,如 Twitter, 
Facebook „Mendeley 等 。 不 同 平台 的 功能 不 同 、 受 众 不 
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等 。 这 些 事件 体现 了 用 户 对 学 术 成 果 的 兴趣 、 认 可 或 
应 用 。 本 小 节 主 要 对 学 术 成 果 的 保存 .标记 和 加 入 讨 
论 组 3 类 事件 进行 分 析 , 从 微观 层面 探讨 事件 的 内 涵 
与 意义 。 

Mendeley 中 的 保存 事件 是 指 用 户 将 某 篇 学 术 文 献 
添加 到 自己 的 library 的 行为 ,被 Altmetric. com 、Lagotto 
等 聚合 器 应 用 于 构建 指标 reader_count, 意 指 有 多 少 用 
户 对 该 文献 进行 了 阅读 。 基 于 本 文 提出 的 社交 媒体 事 
件 模 型 ,对 保存 事件 进行 剖析 ( 见 表 1) ,基于 各 个 要 素 
评判 该 事件 的 学 术 评价 应 用 价值 ,思考 当前 altmetrics 
对 reader_count 指标 的 解读 和 利用 。 

(1) 主体 :Mendeley 的 注册 用 户 是 保存 事件 的 执 
行者 ,他 /她 出 于 何 种 目的 将 文献 保存 在 自己 的 library 
中 ,这 个 目的 真正 能 够 体现 文献 的 学 术 价 值 。 在 无 法 
精确 识别 其 目的 的 情况 下 ,用 户 档案 便 成 为 重要 的 参 
考 信 息 。 新 注册 用 户 必须 从 Mendeley 提供 的 列表 中 
选择 自己 的 职位 (教授 、 副 教授 、 讲 师 、 图 书馆 员 、 本 科 
^E Bii ^E 博士 生 .博士 后 等 ) .学 科 / 子 学 科 ( 艺术 与 
人 文 .计算 机 科学 、 设 计 学 、 经 济 学 等 27 个 选项 ) ,以 及 
选 填 所 属国 家 信息 。 这 些 选 项 决定 了 Mendeley 用 户 
群 基本 属于 学 术 圈 , 其 行为 动机 也 注定 带 有 学 术 色 彩 。 
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表 1 Mendeley 中 保存 事件 的 相关 要 素 解 析 


表 2 Mendeley 中 标记 、 加 入 讨论 组 事件 的 相关 要 素 解析 


序号 XS 含义 / 取 值 事件 名 称 要素 含义 / 取 值 
1 主体 Mendeley 的 注册 用 户 ( 职位、 学 科 / 子 学 科 和 国家 等 ) 标记 类 型 ”评估 
2 ”客体 MERIME library 中 的 学 术 文献 (标识 符 : Arxiv ID .DOI、 产 出 ”学术 文献 被 标记 为 喜欢 的 数量 (starred ) 


ISBN ISSN , PMID „Scopus ID 等 ) 
3 类 型 ” 访问 


4 产 出 D 学术 文献 的 读者 数 (reader_count、 reader_count_by_academ- 


ic, status ,reader count, by, discipline \reader_count_by_coun- 


uy) 
DORRE e eR Rp EG UT 
; a @ 学 习 和 教学 中 进行 利 
”图 保存 自己 的 成 果 , 使 其 能 够 在 Mendeley 中 被 检索 或 济 
览 到 [10,17] 


6 地 点 ”保存 事件 发 生地 点 (用 户 档案 中 的 国家 或 地 区 ) 
7 Ha] 保存 事件 发 生 时 间 


Mendeley 
OH ^H ER Br SCA BUB Hd PALA. API 可 直接 获取 的 数 
据 * 革 他 表格 同 


c 司 ,可 能 会 有 不 同 的 唯一 标识 符 ,包括 
Ariy ID .DOI ISBN „ISSN , PMID „Scopus ID 等 。 
入 (3) 类 型 :用 户 对 文献 的 保存 操作 属于 较 浅 层 的 
USERS RE BIIEIZ 
CIC4) 产 出 :对 某 篇 文献 的 一 次 保存 操作 就 表示 可 
能 游 增 一 名 该 文献 的 阅读 者 , Mendeley API 针对 每 篇 
站 襄 提 供 了 该 文献 被 保存 的 次 数 ,并 且 还 可 按照 用 户 
RRI 学科、 国家 /地 区 进行 分 类 计数 。 需 要 说 明 的 
是 :和 于 可 能 会 有 多 个 用 户 在 不 同时 间 分 别 将 相同 文 
献 嵌 加 至 Mendeley ,因此 对 同一 文献 的 保存 操作 实际 
是 分 散 的 ,需要 进行 聚合 。 然 而 并 不 是 所 有 的 文献 都 
ADOI, Arxiv ID .PMID 等 标识 符 ,因此 Mendeley 并 没 
有 将 唯一 标识 符 作为 聚合 依据 ,而 是 将 具有 相同 标题 、 
作者 以 及 出 版 年 份 的 文献 加 入 到 同一 个 文献 集群 中 ， 
即 识别 为 相同 文献 。 

(5) 动 机 : 即 用 户 为 什么 要 保存 某 篇 学 术 文献 


动机 “用户 将 符合 需求 的 文献 进行 收藏 ,方便 后 续 使 
加 入 讨论 组 类 型 ”应 用 
产 出 ”学 术 文 献 被 加 入 的 讨论 组 数量 (group_count) 

动机 ”中 共享 ,将 学 术 资源 共享 给 讨论 组 的 其 他 成 员 即 在 有 关 
领域 中 与 其 他 学 者 协作 ,共同 讨论 领域 中 的 有 关 论文 ， 
产生 灵感 ; 
@) 交 流 , 与 同行 进行 学 术 交流 ,激发 思想 ; 

@) 构 建 合 作 网 络 ,通过 论文 的 共享 和 交流 与 同行 发 现 合 
作 可 能 [8]。 


虽然 以 上 3 个 事件 的 产 出 均 可 通过 Mendeley API 
进行 获取 ,但 笔者 所 获取 的 数据 与 事件 实际 发 生 情况 
存在 着 滞后 的 问题 。 为 了 应 对 不 同 用 户 在 不 同时 间 、 
以 不 同形 式 对 同一 篇 文献 的 上 传 ,Mendeley 大 约 每 个 
月 会 进行 一 次 批量 聚合 过 程 ,将 相同 文献 的 指标 值 进 
行 聚合 。 在 两 次 批量 聚合 过 程 之 间 , 对 于 用 户 新 添加 
到 library 中 的 文献 , 知 该 文献 在 原文 献 集群 中 有 相同 
元 数据 记录 , 则 该 文献 的 指标 值 会 实时 增 一 ,但 知 该 文 
献 是 第 一 次 加 到 Mendeley 中 ,那么 在 下 次 批量 聚合 过 
程 之 前 ,该 文献 的 指标 值 为 零 。 当 用 户 删 除 其 账户 及 
其 所 有 文献 时 ,直到 下 次 重新 批量 聚合 前 ,该 用 户 仍 被 
计 和 人 该 文献 的 读者 群 ” 。 
3.2 Twitter 

截至 2018 年 3 月 ,Twitter 共有 3.36 亿 活 跃 用 户 ， 
每 天 发 表 约 3.4 亿 条 推 文 。Twitter 提供 的 主要 功能 
括 发 布 和 阅读 推 文 ,发 布 推 文 时 可 以 通过 添加 标签 、 添 
加 wl\@ 其 他 人 等 方式 丰富 推 文 内 容 ,阅读 推 文 时 可 
以 对 自己 感 兴趣 的 推广 进行 转发 .点 赞 和 评论 。 根 据 
Twitter 的 功能 ,可 知 Twitter 中 有 关 学 术 成 果 的 事件 主 
要 包括 :发布 推 文 .转发 推 文 为 推 文 添加 标签 ,为 推 文 
点 赞 、 关 注 推 文 的 发 布 者 \ 回 复 推 文 .发 布 推 文 时 @ 其 


一 些 学 者 采用 问卷 调查 的 方式 调研 了 Mendeley 用 户 
的 保存 动机 ( 见 表 1) ,可 以 作为 评估 其 学 术 价 值 的 基 
础 。 


(6) 地 点 :保存 事件 发 生 的 地 点 可 以 表征 该 文献 
所 传播 影响 的 地 域 范围 ,可 从 用 户 档案 中 进行 提取 。 

(7) 时 间 : 用 户 将 文献 添加 至 自己 的 Mendeley li- 
brary 时 间 ,可 以 精确 到 分 钟 。 

除了 保存 事件 ,Mendeley 中 用 户 对 文献 进行 标记 
和 将 文献 加 入 讨论 组 的 事件 也 有 学 术 评 价 应 用 价值 ， 
并 且 这 两 个 事件 与 保存 事件 主要 是 在 类 型 . 产 出 和 动 
机 方面 存在 区 别 , 如 表 2 所 示 : 


他 人 。Twitter 中 发 布 推 文 事件 的 相关 要 素 见 表 3。 

(1) 主 体 :Twitter 的 注册 用 户 是 推 文 的 发 布 者 ， 
家 /地 区 和 职业 /身份 有 助 于 了 解 用 户 发 布 推 文 的 背景 
和 目的 。 这 些 信息 可 以 从 用 户 档 案 中 加 以 提取 ,例如 
Altmetric. com 将 职业 /身份 信息 提炼 为 社会 大 众 、 科 学 
家 、 科 学 传播 者 (记者 、 博 主 、 编 辑 等 ) 、 从 业者 (医生 、 
其 他 医护 专业 人 员 ) 等 。 

(2) 客 体 : 指 在 推 文中 提 及 的 学 术 对 象 。Twitter 中 
识别 文献 的 方法 是 判断 推 文中 是 否 有 指向 文献 唯一 标 
识 符 的 直接 链接 ,目前 主要 是 基于 文献 的 DOI 进行 判 
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图 二 情报 三 作 


$863 35 $8 19 Hg. 2019 年 10 月 
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表 3 Twitter 中 发 布 推 文 事件 的 相关 要 素 解析 
序号 ”要 素 含义 / 取 值 
1 EW Twitter 的 注册 用 户 (国家 /地 区 、 职 业 / 身 份 ) 
2 ”客体 推 文 中 提 及 的 学 术 成 果 
3 ”类 型 ”评估 /应 用 
4 E OXA (tweets) 
@) 推 文 提 及 数 
5 动机 中 讨 论 , 讨 论 存 在 争议 的 问题 或 解释 分 歧 ; 
@) 批 评 , 指 错误 或 不 恰当 的 地 方 ; 
@) 推 荐 ,进行 学 术 成 果 的 推荐 ; 
@ 自 我 推广 ,推送 与 自身 相关 的 文献 内 容 ; 
@ 提 供 数 据 ,提供 具有 实际 意义 的 数据 和 事实 i201。 
6 ”地 点 ”发布 推 文 的 地 点 (用 户 档 案 中 的 国家 /地 区 ) 
7 WA ” 推 文 的 发 布 时 间 
8 ”来 源 Twitter 


3) 类 型 :用 户 发 布 有 关 某 篇 文献 的 推 文 ,表达 了 
对 该 文献 的 某 种 态度 ,同时 推 文 也 可 能 引发 深层 次 的 
评 浴 ,因此 该 事件 可 以 归 为 评估 或 应 用 类 型 。 

CS(4) 产 出 :发 布 推 文 事件 的 直接 产 出 是 一 条 推 文 ， 
Ter 的 推 文 早期 最 多 包含 140 个 字符 ,2017 4E 11 月 


后 上 限 是 280 字符 ( 中文 日文 和 韩文 除外 ) ,可 以 通过 


Twitter API 进行 直接 获取 ;间接 产 出 是 新 增 一 条 该 文 


献 的 推 文 提 及 数 。 当 前 聚合 器 主要 是 通过 推 文中 


url 


指向 的 唯一 标识 符 来 判断 是 否 提 及 某 篇 文献 ,但 不 同 
聚合 吉 的 算法 各 不 相同 ,会 对 推 文 进行 不 同 程度 的 清 


洗 。 例 如 ,CED( Crossref Event Data) 在 识别 文献 时 ,使 
用 的 是 Crossref 或 DataCite 发 布 的 DOI, 知 一 篇 文献 的 


DOI 不 属于 这 个 范畴 ,这 篇 文献 就 无 法 被 识别 。 


(5) 动 机 :用 户 为 什么 要 在 推 文中 提 及 某 篇 学 术 


文献 ,一些 学 者 进行 了 研究 , 见 表 3。 


《6) 地 点 :反映 推 文 发 布 者 所 来 自 的 地 域 范 围 ,可 


以 根据 Twitter 用 户 的 个 人 资料 进行 提取 。 
(7) 时 间 :用户 发 布 推 文 的 时 间 ,可 以 精确 到 秘 


o 


Twitter 中 用 户 转发 推 文 为 推 文 添加 标签 ,为 推 文 
SUBE .关注 推 文 的 发 布 者 .回复 推 文 ,发布 推 文 时 @ 其 他 
人 也 有 学 术 评价 应 用 价值 ,并 且 这 些 事件 与 保存 事件 主 


要 是 在 类 型 产 出 和 动机 方面 存在 区 别 ,如 表 4 所 示 : 


e 表 4 Twitter 中 各 事件 的 相关 要 素 解 析 
E Tian 要 素 含义 / 取 什 
CÓ) 转发 推广 类 型 评估 /应 用 
CN 产 出 MEER RHL retweet_count) 
E 动机 加 向 粉丝 或 其 他 受众 扩散 传播 推 文 , 并 添加 新 的 内 容 来 评论 原 推 文 或 公开 同意 .支持 原 推 文 ; 
NI @ 作 为 粉丝 ,通过 转发 的 方式 证 明 自己 正在 关注 该 推 文 ; 
> OLENE B, EH F EMRA RAIET R DIL ER 
nd @@ 为 了 获取 更 多 的 粉丝 ,或 者 从 更 多 的 参与 者 中 获得 互惠 ; 
>< 回 通过 转发 来 保存 该 推 文 ,以 备 将 来 个 人 访问 [2 。 
《加 为 推 文 添加 标签 类 型 评估 /应 用 
c 产 出 @D 所 添加 的 标签 (hashtags) 
c DORRA 
T Zn QD 能 与 有 共同 兴趣 的 用 户 交 换 意见 .参与 对 话 ; 
@ 为 了 获得 更 多 新 粉丝 ,使 推 文 更 容易 得 到 转发 [2] 。 
为 推 文 点 先 ES 评估 
产 出 推 文 点 赞 数 (favorite_count) 
abb 对 自己 认可 或 喜欢 的 推广 进行 点 赞 [23] 
关注 推 文 的 发 布 者 类 型 访问 
产 出 账户 美 注 数 (followers_count) 
ab 追踪 推 文 发 布 者 的 动向 [24] 
回复 推广 类 型 评估 /应 用 
产 出 推 文 回复 数 
EIL 发 表 自己 的 意见 ,进行 对 话 [31。 
发 布 推 文 时 @ 其 他 人 类 型 评估 /应 用 
产 出 含 @ 的 推 文 数量 (user_mentions) 
abb 确保 特定 账户 能 接收 到 推 文 并 鼓励 其 进行 转发 2]。 
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与 Mendeley %44 , Twitter 相关 事件 的 产 出 会 受到 
Twitter API 及 不 同 聚 合 器 的 数据 采集 机 制 的 影响 , 可 
能 所 获取 到 的 产 出 与 实际 存在 偏差 和 清 后 。 例 如 在 各 


自 官方 网 站 的 介绍 中 , Altmetric. com 表明 可 以 提供 


2011 年 6 月 以 后 的 推 文 数据 ,并 实时 更 新 ; Lagotto 


提 


供 2012 年 6 月 之 后 的 数据 , 且 是 每 6 小 时 收集 一 次 ; 
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Plum Analytics 则 提供 2011 年 1 月 1 日 之 后 的 数据 ,并 
实时 更 新 。 


4 TII 


通过 上 述 相关 事件 的 梳理 和 解析 ,可 以 发 现 如 下 
主要 结论 : 

(1) 目前 聚合 器 及 一 些 应 用 中 仅 使 用 了 社交 媒体 
中 部 分 事件 产生 的 指标 , 比如 Mendeley 中 由 保存 事件 
产生 的 reader. count ,Twitter 中 的 twitter DOI mentions, 
然而 还 有 很 多 社交 媒体 事件 同样 具有 学 术 评价 应 用 价 
值 ,包括 Mendeley 中 将 学 术 文献 被 标记 为 喜欢 和 加 入 
讨论 组 ,Twitter 中 发 布 提 及 学 术 成 果 的 推 文 .转发 推 
文 为 推 文 添加 标签 ,为 推 文 点 赞 、 关 注 推 文 的 发 布 者 、 
回复 推 文 .发布 推 文 时 @ 其 他 人 等 。 
全 (2) 不 同 社交 媒体 事件 的 参与 主体 存在 差别 ,所 
民 映 的 学 术 成 果 影 响 力 存在 较 大 的 差别 ,例如 Mende- 
8 用 户 大 多 都 是 有 文献 管理 需求 的 研究 人 员 ,该 平台 
产 弄 的 指标 更 偏向 于 反映 文献 的 学 术 影响 力 ; Twitter 
用 襄 范围 则 更 加 广泛 ,更 偏向 于 反映 文献 在 普通 大 众 
中 鸭 传 播 能 力 或 社会 影响 力 。 然 而 ,主体 的 身份 .背景 
佑 似 只 能 比较 粗略 地 反映 其 在 事件 中 的 态度 ,只 有 深 
A 得 析 主体 在 事件 发 生 过 程 中 的 动机 ,与 评价 目标 联 
系 谍 为 紧密 的 一 个 要 素 , 才 是 altmetrics 指标 进行 有 效 
应 二 的 关键 。 
(3) 社 交 媒 体 事件 的 产 出 即 最 终 用 于 评价 的 指 
6 其 提取 策略 和 计算 方法 对 于 指标 的 准确 性 ,科学 性 
和 及 时 性 非常 重要 。 我 们 可 以 尽量 利用 各 平台 提供 的 
AP 进行 数据 获取 ,并 构建 合理 的 指标 计算 模型 ,例如 
在 计算 altmetrics 指标 时 ,可 以 考虑 将 产生 指标 的 事件 的 
各 种 动机 考虑 进来 ,在 计算 推 文 提 及 数 时 ,去 除 自我 扒 
广 或 不 良 动机 的 推 文 , 且 对 文献 的 负面 评价 予以 负 值 ， 
或 者 对 不 同 态度 予以 不 同 的 权重 。 在 实际 应 用 中 ,对 事 
件 产 出 的 提取 会 受到 技术 ,伦理 、 商 业 利 益 等 因素 的 影 
响 , 因 此 一 方面 要 尽量 避免 这 些 因素 的 干扰 , 另 一 方面 
要 对 产 出 的 偏差 有 清楚 的 认识 ,在 应 用 中 客观 对 待 。 

(4) 社 交 媒 体 的 初衷 并 不 是 服务 于 学 术 评 价 ,而 
是 提供 分 享 意见 .见解 ,经验 和 观点 的 平台 ,因此 必须 
对 相关 事件 的 本 质 进行 剖析 ,判断 其 与 学 术 评价 目标 
是 否 一 致 ,进行 合理 利用 。 学 术 评价 的 层面 包括 学 术 
成 果 、 个 人 机构 和 期 刊 等 ,其 中 学 术 成 果 包 括 论文 UR 
作 、 软 件 和 专利 等 ,所 衡量 的 可 能 是 社会 影响 力 、 学 术 
影响 力 等 ,评价 目标 可 能 是 决定 任职 晋升 .奖项 获取 、 
项 目 资金 分 配 .机 构 评估 学 科 专 业 排名 等 ,评价 的 范 


围 可 能 会 限定 在 某 个 学 科 或 某 段 时 间 内 。 学 术 评 价 场 
景 的 复杂 性 决定 了 具体 操作 情境 存在 较 大 差异 ,不 能 
一 概 而 论 。 因 此 ,在 使 用 altmetrics 进行 评价 时 需要 从 
社交 媒体 事件 本 身 及 其 各 要 素 的 特征 出 发 进行 综合 
虑 。 例 如 可 以 利用 事件 的 主体 特征 与 评价 的 学 科 、 事 
件 的 客体 与 评价 对 象 的 匹配 程度 对 平台 进行 筛选 ,再 
将 事件 的 类 型 产 出 动机 与 评价 目标 相 结 合 ,综合 考 
虑 事件 的 时 间 、 地 点 等 客观 因素 ,考虑 数据 的 产生 频 
率 采集 频率 以 及 可 获取 性 等 ,使 最 终 用 于 评价 的 指标 
更 为 科学 合理。 除 此 之 外 ,我们 也 会 发 现 与 学 术 成 果 
相关 的 社交 媒体 事件 与 传统 的 引用 事件 存在 很 多 相似 
之 处 ,在 对 altmetrics 的 研究 中 可 以 充分 借鉴 引文 的 相 
关 理 论 与 方法 。 

在 今后 的 研究 中 ,除了 本 文 所 分 析 的 社交 媒体 事 
件 ,我 们 还 可 以 将 更 多 来 源 .更 多 事件 的 直接 产 出 或 间 
接 产 出 纳入 到 学 术 评 价 体 系 中 ,并 对 它们 的 适用 范围 、 
适用 程度 进行 分 析 。 然 而 ,本 文 也 存在 一 些 不 足 之 处 。 
笔者 所 构建 的 社交 媒体 事件 模型 只 是 揭示 了 事件 所 关 
联 的 要 素 , 但 对 于 要 素 之 间 更 深层 次 的 关系 并 未 体现 ; 
仅 选 取 相 关 研 究 中 提 及 较 多 的 Mendeley 和 Twitter 两 
个 平台 中 的 事件 进行 说 明 , 没 有 对 更 多 其 他 平台 的 事 
件 进 行 梳理 ,缺乏 平台 之 间 更 全 面 深 入 的 对 比 ;事件 的 
动机 是 altmetrics 人 研究 的 关键 问题 ,但 笔者 仅 通过 已 有 
研究 进行 了 总 结 ,未 来 我 们 将 采用 内 容 分 析 法 和 访谈 
调查 的 方式 进一步 推进 。 
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Zhao Zhuojing 


Abstract. [ Purpose/significance | In order to clarify the connotation and significance of the attention, dissemination and 
utilization of academic achievements in social media, to make a deep analysis of the altmetrics indicators that have been used 
and can be mined. [ Method/ process | From the perspective of event ontology , the acts related to academic achievements in so- 
cial media are abstracted. Starting from the subject, object, product, type, motivation, time, place and resource of the event , 
the event model of social media is constructed. And the deep analysis of social media events is carried out with Mendeley and 
Twitter as examples. [ Result/conclusion | At present, altmetrics aggregators only provide indicators from some social media e- 
vents. Through the analysis of social media events and their elements , it is found that some other indicators with academic eval- 
uation value should be included in evaluation system in the future, such as Mendeley group. count , Twitter favorite count and so 
on. When using these indicators , it is necessary to evaluate the applicability of indicators in different academic evaluation con- 
texts according to the elements of events. Meanwhile, the methods, frequencies and limitations of data acquisition should be 
taken into account to ensure the accuracy and scientificity of the indicators. 
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